扫描下载APP
其它方式登录
谷歌未发布的视频模型Gemini Omni生成的两条视频引发轰动:教授黑板推导数学公式与男士海边吃意面,展现出符号推理、空间关系建模和跨模态时序对齐三大突破,标志着AI正逼近具备现实世界理解能力的‘世界模型’阶段。
谷歌提前曝光Gemini 3.5 Pro与3.5 Flash模型,强调其在SVG生成、交互式Web应用构建及编程能力上的显著提升,并推出全时AI智能体Gemini Spark;尽管性能对标GPT-5.5,但在编程领域仍落后于Anthropic的Claude,谷歌正以分发优势和Agent数据闭环加速追赶。
文章探讨大语言模型因RLHF训练机制导致的“讨好型”回应倾向,通过实测ChatGPT、Gemini和豆包在数学错误、职场冲突、情感咨询等场景中的表现,揭示AI为获取正向反馈而牺牲事实准确性和批判性,优先提供情绪价值而非真实帮助的现象,并指出该问题源于设计逻辑与商业诉求的共同作用。
Google DeepMind推出由Gemini驱动的AI增强型鼠标指针原型,实现‘指哪打哪’的自然交互:光标悬停即理解上下文,结合语音、视觉与语义识别,无需手动复制粘贴或编写提示词,直接通过指向和口语指令完成编辑、搜索等操作,标志着人机交互从‘人主动表达’迈向‘机器主动理解’的新范式。
爱奇艺CEO龚宇提出AI时代“去中心化”战略,通过自研AI影视制作平台纳逗Pro,整合奇智大模型及多家视频生成模型,赋能创作者降低长视频制作门槛与成本,推动内容生产规模化、创作者版权与收入自主化,并以技术开放、补贴政策和工作室机制加速AIGC在中剧、长剧等商业长片领域的落地。
谷歌推出全新AI原生笔记本Googlebook,以Gemini Intelligence为核心,深度融合Android与ChromeOS,强调多设备协同、本地AI工作流承载及高端硬件支撑,旨在抢占Agent时代PC这一关键生产力入口,回应AI编程、本地模型和跨应用协作对电脑性能与系统深度的新需求。
谷歌在Android专属发布会上宣布Android将从操作系统升级为智能系统(Intelligence System),以Gemini Intelligence为核心驱动,深度整合多模态AI能力,覆盖手机(Android 17)、笔记本(Googlebook)、车机(Android Auto)全场景,实现跨设备统一智能体验,对标苹果理想中的AI生态。
谷歌提前曝光全新多模态视频生成模型Gemini Omni,支持文本、图像、音频、视频输入输出,具备高精度数学公式推导、实时视频编辑(如去水印、物体替换)和风格化生成能力,性能显著超越已关停的OpenAI Sora,将在I/O 2026大会上正式发布。
开发者antirez为DeepSeek V4 Flash模型推出专用本地推理引擎ds4,使其可在128GB内存的MacBook Pro上高效运行,实现零token成本的本地AI编程助手功能;该方案通过不对称2-bit量化、SSD KV缓存和Metal原生优化达成性能突破,既提升DeepSeek海外生态认可度,也对其API商业化路径构成挑战。
文章深度解析Anthropic Claude Opus 4.7、OpenAI GPT 5.5和Google Gemini 3 Pro三大主流大模型的泄漏版system prompt,对比其篇幅规模、格式规范、人格塑造逻辑(如Claude重哲学边界、GPT重商业落地、Gemini重适应性)、伦理设计(如记忆边界)及商业化意图(广告、电商、版权合规等),揭示system prompt如何实质定义AI的‘身份’与行为底色。
爱奇艺正全面拥抱AI技术,推动影视行业从中心化向去中心化转型。通过自研AI平台纳逗Pro、奇智大模型及70余个智能体,降低长视频制作成本与周期,赋能中小创作者。龚宇判断AI将引发内容供给指数级增长,未来五年半数以上头部作品或由AI生成,平台重心转向构建开放生态与分账机制。
陶哲轩提出数学正从证明稀缺时代进入证明过剩时代,AI大幅加速证明生成与验证,但人类对证明的理解(消化)严重滞后,导致大量‘生肉证明’堆积、抑制学术进展;他强调未来数学家的核心竞争力在于问题选择、工作流设计及证明消化能力,学术评价体系亟需重构。
Alphabet一季度营收1099亿美元,同比增长22%,超预期;谷歌云收入达200.3亿美元,增速63%,积压订单近4620亿美元,AI驱动成核心增长引擎;资本开支上调至最高1900亿美元,凸显AI算力投入决心;净利润含369亿美元投资浮盈,经营利润稳健增长。
文章以苹果两条技术路线——自研芯片(Apple Silicon)与人工智能(AI)能力——为双主线,对比分析其三十年发展轨迹:芯片线历经多次失败后卧薪尝胆,终实现全栈自主并支撑产品创新;AI线虽起步最早(Siri),却因战略摇摆、组织割裂与执行滞后持续落后,最终转向依赖Google Gemini等外部模型。核心命题是苹果是否仍具备定义新时代产品的能力。
小米开源MiMo-V2.5系列大模型,含1.02万亿参数的MiMo-V2.5-Pro,支持100万上下文与高效Agent能力,在多项基准测试中超越DeepSeek-V4-Pro及Kimi K2.6等主流模型;首日完成阿里平头哥、AMD等7家芯片厂商适配,并推出100万亿Token激励计划及Agent生态共建合作。